DUAL-BLADE: Descarga de caché KV directa NVMe de doble ruta para inferencia de LLM en el borde Acelera la inferencia de LLM en el borde con la descarga de caché KV NVMe de doble ruta. Reduce latencia y mejora eficiencia en dispositivos periféricos. 2026-04-30 · 1 min